home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1994 March / Internet Info CD-ROM (Walnut Creek) (March 1994).iso / inet / internet-drafts / draft-alvestrand-lang-char-00.txt < prev    next >
Text File  |  1993-07-08  |  60KB  |  2,215 lines

  1.  
  2.  
  3.            Characters and character sets for various languages
  4.  
  5.                      Thu Jun 17 12:29:46 MET DST 1993
  6.  
  7.  
  8.                          Harald Tveit Alvestrand
  9.                                SINTEF DELAB
  10.                     Harald.Alvestrand@delab.sintef.no
  11.  
  12.  
  13.  
  14.     Abstract
  15.  
  16.     There is a need to have a source of information about the
  17.     characters that are used in various languages. No such information
  18.     is currently readily available on the net. This document attempts
  19.     to fill that void.
  20.  
  21.  
  22.     Status of this Memo
  23.  
  24.     This draft document is being circulated for comment.
  25.     It does not yet cover anything but Latin-based scripts; volunteers
  26.     to collect material for other scripts are sought.
  27.  
  28.     Please send comments to the author, or to the RARE WG-CHAR list
  29.     <wg-char@rare.nl>.
  30.  
  31.     The following text is required by the Internet-draft rules:
  32.  
  33.     This document is an Internet Draft.  Internet Drafts are working
  34.     documents of the Internet Engineering Task Force (IETF), its
  35.     Areas, and its Working Groups. Note that other groups may also
  36.     distribute working documents as Internet Drafts.
  37.  
  38.     Internet Drafts are draft documents valid for a maximum of six
  39.     months. Internet Drafts may be updated, replaced, or obsoleted by
  40.     other documents at any time.  It is not appropriate to use
  41.     Internet Drafts as reference material or to cite them other than
  42.     as a "working draft" or "work in progress."
  43.  
  44.     Please check the I-D abstract listing contained in each Internet
  45.     Draft directory to learn the current status of this or any other
  46.     Internet Draft.
  47.  
  48.  
  49.  
  50.  
  51.  
  52. Alvestrand                Expires Dec 17 93                   [Page 1]
  53.  
  54. draft                Languages and character sets               Mar 93
  55.  
  56.  
  57.     1.  Introduction
  58.  
  59.     There are a lot of languages in the world. Estimates vary between
  60.     500 and 6000, with some eternal conflicts about the difference
  61.     between a language and a dialect guaranteeing that any list
  62.     claiming to be authoritative will be the source of endless debate.
  63.  
  64.     Many of these languages have a writing system. Some have several.
  65.     These are also likely to have changed over time, with the meaning
  66.     of character symbols changing, the shape of the characters
  67.     changing, or completely new characters being added, or old ones
  68.     removed from the set. This means that even within a single
  69.     language, a list of characters is likely to be controversial.
  70.  
  71.     These problems have made several experts in the field of languages
  72.     and characters refuse to even consider the idea of working out
  73.     such a list.
  74.  
  75.     Nevertheless, it is clear that an easily available source of this
  76.     kind of information is needed, in order to:
  77.  
  78.  
  79.     (1)  Identify the problems encountered when trying to use
  80.          equipment with limited character support for a language
  81.  
  82.     (2)  Identify what support for additional characters will be
  83.          "enough" for that language
  84.  
  85.     (3)  Identify what internationally standardized character sets are
  86.          able to fulfill the requirements for that languag
  87.  
  88.  
  89.     The tables given below are an attempt at providing such an
  90.     identification.
  91.  
  92.     The rest of the document is in 3 parts: The language tables a
  93.  
  94.  
  95.  
  96.  
  97.     2.  Introduction to language tables
  98.  
  99.  
  100.  
  101.  
  102.  
  103.  
  104.  
  105.  
  106. Alvestrand                Expires Dec 17 93                   [Page 2]
  107.  
  108. draft                Languages and character sets               Mar 93
  109.  
  110.  
  111.     2.1.  Table structure
  112.  
  113.     Each language is listed in 4 parts:
  114.  
  115.  
  116.     (1)  The language name with its ISO 639 code if applicable
  117.  
  118.     (2)  The characters required for that language. For brevity, the
  119.          characters of ASCII (A-Z) are not listed. Note that some
  120.          languages do NOT require all the ASCII characters.
  121.  
  122.     (3)  Characters that are in normal use, but have replacements that
  123.          mostly do not change the meaning of the word in context.
  124.          These may be called "optional" characters. This should _not_
  125.          be taken as liberty to remove those characters from the
  126.          language, but as a reminder that if it is great trouble to
  127.          use the charsets that cover the complete language, a smaller
  128.          character set may be used without causing grievous harm to
  129.          the expressive power of the writer.
  130.  
  131.     (4)  Internationally registered character sets that cover the
  132.          required and/or optional characters for that language.
  133.  
  134.     (5)  Comments
  135.  
  136.          The division between "required" and "optional" characters is
  137.          likely to produce much discussion. As a rough guide, I have
  138.          taken the registered ISO 646 variants of a number of
  139.          countries, and classified as "optional" all characters which
  140.          did _not_ appear in that ISO 646 variant. As a result, an ISO
  141.          646 variant should appear under the "required characters
  142.          only" for all languages that have an ISO 646 variant.
  143.  
  144.          Note that for brevity, only the lower case version of the
  145.          character is listed. If no note is made, one should assume
  146.          that the upper case version is equally required.
  147.  
  148.          Note, however, that a lot of languages permit the dropping of
  149.          accents on upper case characters where it would be considered
  150.          improper to drop them on lower case characters.
  151.  
  152.  
  153.  
  154.  
  155.  
  156.  
  157.  
  158.  
  159.  
  160. Alvestrand                Expires Dec 17 93                   [Page 3]
  161.  
  162. draft                Languages and character sets               Mar 93
  163.  
  164.  
  165.     2.2.  Sources utilized
  166.  
  167.     The table of Latin-script languages is based on work by Johan van
  168.     Wingen.  <BUTPAA@rulmvs.leidenuniv.nl>. The others are best
  169.     guesses by the author.
  170.  
  171.     The tables of character sets prepared by Keld Jorn Simonsen
  172.     <keld@dkuug.dk> (RFC-KELD) were invaluable in matching the data on
  173.     languages to the data on character sets.
  174.  
  175.     The language codes (for those languages that have codes) come from
  176.     ISO 639.
  177.  
  178.     NOTE: ISO 639 is a very incomplete list of the world's languages
  179.     (perhaps 10 or 20 % according to some experts), and is undergoing
  180.     revision. The only reason for using it is that it is the only
  181.     ISO-standardized shorthand notation for languages available at the
  182.     moment.
  183.  
  184.     Languages for which no such exact information is known are listed
  185.     at the end of the tables.
  186.  
  187.  
  188.     2.3.  What accents mean
  189.  
  190.     For those who feel unfamiliar with the names of accents:
  191.  
  192.  
  193.     Grave
  194.          slants upwards to the left, like the Unix "backtick".
  195.  
  196.  
  197.     Acute
  198.          slants upwards to the right.
  199.  
  200.  
  201.     Circumflex
  202.          looks like a little pointed hat.
  203.  
  204.  
  205.     Tilde
  206.          looks like a wavy line.
  207.  
  208.  
  209.  
  210.  
  211.  
  212.  
  213.  
  214. Alvestrand                Expires Dec 17 93                   [Page 4]
  215.  
  216. draft                Languages and character sets               Mar 93
  217.  
  218.  
  219.     Macron
  220.          looks like a bar placed on top of the character.
  221.  
  222.  
  223.     Breve
  224.          looks like the lower quarter of a circle, placed on top of
  225.          the character.
  226.  
  227.  
  228.     Dot above
  229.          should be self-explanatory.
  230.  
  231.  
  232.     Diaeresis
  233.          looks like 2 dots above the character.
  234.  
  235.  
  236.     Ring above
  237.          should be self-explanatory.
  238.  
  239.  
  240.     Cedilla
  241.          looks like a little squiggle on the bottom of the letter,
  242.          down and then left.
  243.  
  244.  
  245.     Ogonek
  246.          looks like a squiggle too, but goes down and to the right.
  247.  
  248.  
  249.     Caron
  250.          looks like a little "v" on top of the character.
  251.  
  252.  
  253.     3.  Language tables   This language has no known character set
  254.  
  255.  
  256.     3.1.  lt Lithuanian
  257.  
  258.     Required characters
  259.  
  260.     a;    0105 LATIN SMALL LETTER A WITH OGONEK
  261.     e;    0119 LATIN SMALL LETTER E WITH OGONEK
  262.     i;    012f LATIN SMALL LETTER I WITH OGONEK
  263.  
  264.  
  265.  
  266.  
  267.  
  268. Alvestrand                Expires Dec 17 93                   [Page 5]
  269.  
  270. draft                Languages and character sets               Mar 93
  271.  
  272.  
  273.     u;    0173 LATIN SMALL LETTER U WITH OGONEK
  274.     e.    0117 LATIN SMALL LETTER E WITH DOT ABOVE
  275.     u-    016b LATIN SMALL LETTER U WITH MACRON
  276.     c<    010d LATIN SMALL LETTER C WITH CARON
  277.     s<    0161 LATIN SMALL LETTER S WITH CARON
  278.     z<    017e LATIN SMALL LETTER Z WITH CARON
  279.  
  280.     Character sets covering the whole
  281.  
  282.     videotex-suppl (iso 70)
  283.     iso-ir-90 (iso 90)
  284.     ANSI_X3.110-1983 (iso 99)
  285.     T.61-8bit (iso 103)
  286.     ISO_8859-4:1988 (iso 110)
  287.     T.101-G2 (iso 128)
  288.     ISO_6937-2-add (iso 142)
  289.     latin6 (iso 157)
  290.     JIS_X0212-1990 (iso 159)
  291.  
  292.  
  293.     3.2.  lv Latvian
  294.  
  295.     Required characters
  296.  
  297.     a-    0101 LATIN SMALL LETTER A WITH MACRON
  298.     e-    0113 LATIN SMALL LETTER E WITH MACRON
  299.     i-    012b LATIN SMALL LETTER I WITH MACRON
  300.     o-    014d LATIN SMALL LETTER O WITH MACRON
  301.     u-    016b LATIN SMALL LETTER U WITH MACRON
  302.     g,    0123 LATIN SMALL LETTER G WITH CEDILLA
  303.     k,    0137 LATIN SMALL LETTER K WITH CEDILLA
  304.     l,    013c LATIN SMALL LETTER L WITH CEDILLA
  305.     n,    0146 LATIN SMALL LETTER N WITH CEDILLA
  306.     r,    0157 LATIN SMALL LETTER R WITH CEDILLA
  307.     c<    010d LATIN SMALL LETTER C WITH CARON
  308.     s<    0161 LATIN SMALL LETTER S WITH CARON
  309.     z<    017e LATIN SMALL LETTER Z WITH CARON
  310.  
  311.     Character sets covering the whole
  312.  
  313.     videotex-suppl (iso 70)
  314.     iso-ir-90 (iso 90)
  315.     ANSI_X3.110-1983 (iso 99)
  316.     T.61-8bit (iso 103)
  317.  
  318.  
  319.  
  320.  
  321.  
  322. Alvestrand                Expires Dec 17 93                   [Page 6]
  323.  
  324. draft                Languages and character sets               Mar 93
  325.  
  326.  
  327.     ISO_8859-4:1988 (iso 110)
  328.     T.101-G2 (iso 128)
  329.     ISO_6937-2-add (iso 142)
  330.     latin6 (iso 157)
  331.  
  332.  
  333.     3.3.  et Estonian
  334.  
  335.     Required characters
  336.  
  337.     o?    00f5 LATIN SMALL LETTER O WITH TILDE
  338.     a:    00e4 LATIN SMALL LETTER A WITH DIAERESIS
  339.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  340.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  341.     s<    0161 LATIN SMALL LETTER S WITH CARON
  342.     z<    017e LATIN SMALL LETTER Z WITH CARON
  343.  
  344.     Character sets covering the whole
  345.  
  346.     videotex-suppl (iso 70)
  347.     iso-ir-90 (iso 90)
  348.     ANSI_X3.110-1983 (iso 99)
  349.     T.61-8bit (iso 103)
  350.     ISO_8859-4:1988 (iso 110)
  351.     T.101-G2 (iso 128)
  352.     ISO_6937-2-add (iso 142)
  353.     latin6 (iso 157)
  354.     JIS_X0212-1990 (iso 159)
  355.  
  356.  
  357.     3.4.  fi Finnish
  358.  
  359.     Required characters
  360.  
  361.     a:    00e4 LATIN SMALL LETTER A WITH DIAERESIS
  362.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  363.  
  364.     Character sets covering the whole
  365.  
  366.     NATS-SEFI (iso 8)
  367.     NATS-DANO-ADD (iso 9)
  368.     SEN_850200_B (iso 10)
  369.     SEN_850200_C (iso 11)
  370.     DIN_66003 (iso 21)
  371.  
  372.  
  373.  
  374.  
  375.  
  376. Alvestrand                Expires Dec 17 93                   [Page 7]
  377.  
  378. draft                Languages and character sets               Mar 93
  379.  
  380.  
  381.     videotex-suppl (iso 70)
  382.     iso-ir-90 (iso 90)
  383.     ANSI_X3.110-1983 (iso 99)
  384.     ISO_8859-1:1987 (iso 100)
  385.     ISO_8859-2:1987 (iso 101)
  386.     T.61-8bit (iso 103)
  387.     ISO_8859-3:1988 (iso 109)
  388.     ISO_8859-4:1988 (iso 110)
  389.     T.101-G2 (iso 128)
  390.     CSN_369103 (iso 139)
  391.     ISO_6937-2-add (iso 142)
  392.     ISO_8859-9:1989 (iso 148)
  393.     latin6 (iso 157)
  394.     JIS_X0212-1990 (iso 159)
  395.  
  396.  
  397.     3.5.  ?? Sami
  398.  
  399.     Required characters
  400.  
  401.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  402.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  403.     a>    00e2 LATIN SMALL LETTER A WITH CIRCUMFLEX
  404.     a:    00e4 LATIN SMALL LETTER A WITH DIAERESIS
  405.     e:    00eb LATIN SMALL LETTER E WITH DIAERESIS
  406.     i:    00ef LATIN SMALL LETTER I WITH DIAERESIS
  407.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  408.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  409.     ae    00e6 LATIN SMALL LETTER AE
  410.     aa    00e5 LATIN SMALL LETTER A WITH RING ABOVE
  411.     o/    00f8 LATIN SMALL LETTER O WITH STROKE
  412.     d/    0111 LATIN SMALL LETTER D WITH STROKE
  413.     n'    0144 LATIN SMALL LETTER N WITH ACUTE
  414.     ng    014b LATIN SMALL LETTER ENG
  415.     t/    0167 LATIN SMALL LETTER T WITH STROKE
  416.     c<    010d LATIN SMALL LETTER C WITH CARON
  417.     s<    0161 LATIN SMALL LETTER S WITH CARON
  418.     z<    017e LATIN SMALL LETTER Z WITH CARON
  419.  
  420.     Character sets covering the whole
  421.  
  422.     videotex-suppl (iso 70)
  423.     iso-ir-90 (iso 90)
  424.     ANSI_X3.110-1983 (iso 99)
  425.  
  426.  
  427.  
  428.  
  429.  
  430. Alvestrand                Expires Dec 17 93                   [Page 8]
  431.  
  432. draft                Languages and character sets               Mar 93
  433.  
  434.  
  435.     T.61-8bit (iso 103)
  436.     T.101-G2 (iso 128)
  437.     ISO_6937-2-add (iso 142)
  438.     latin6 (iso 157)
  439.     JIS_X0212-1990 (iso 159)
  440.  
  441.  
  442.     3.6.  sv Swedish
  443.  
  444.     Required characters
  445.  
  446.     a:    00e4 LATIN SMALL LETTER A WITH DIAERESIS
  447.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  448.     aa    00e5 LATIN SMALL LETTER A WITH RING ABOVE
  449.  
  450.     Optional characters
  451.  
  452.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  453.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  454.     e:    00eb LATIN SMALL LETTER E WITH DIAERESIS
  455.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  456.  
  457.     Character sets covering the whole
  458.  
  459.     videotex-suppl (iso 70)
  460.     iso-ir-90 (iso 90)
  461.     ANSI_X3.110-1983 (iso 99)
  462.     ISO_8859-1:1987 (iso 100)
  463.     T.61-8bit (iso 103)
  464.     ISO_8859-4:1988 (iso 110)
  465.     T.101-G2 (iso 128)
  466.     ISO_6937-2-add (iso 142)
  467.     ISO_8859-9:1989 (iso 148)
  468.     latin6 (iso 157)
  469.     JIS_X0212-1990 (iso 159)
  470.  
  471.     Character sets covering the required characters only
  472.  
  473.     NATS-SEFI (iso 8)
  474.     SEN_850200_B (iso 10)
  475.     SEN_850200_C (iso 11)
  476.  
  477.  
  478.  
  479.  
  480.  
  481.  
  482.  
  483.  
  484. Alvestrand                Expires Dec 17 93                   [Page 9]
  485.  
  486. draft                Languages and character sets               Mar 93
  487.  
  488.  
  489.     3.7.  no Norwegian
  490.  
  491.     Required characters
  492.  
  493.     ae    00e6 LATIN SMALL LETTER AE
  494.     aa    00e5 LATIN SMALL LETTER A WITH RING ABOVE
  495.     o/    00f8 LATIN SMALL LETTER O WITH STROKE
  496.  
  497.     Optional characters
  498.  
  499.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  500.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  501.     o>    00f4 LATIN SMALL LETTER O WITH CIRCUMFLEX
  502.  
  503.     Character sets covering the whole
  504.  
  505.     videotex-suppl (iso 70)
  506.     iso-ir-90 (iso 90)
  507.     ANSI_X3.110-1983 (iso 99)
  508.     ISO_8859-1:1987 (iso 100)
  509.     T.61-8bit (iso 103)
  510.     T.101-G2 (iso 128)
  511.     ISO_6937-2-add (iso 142)
  512.     ISO_8859-9:1989 (iso 148)
  513.     latin6 (iso 157)
  514.     JIS_X0212-1990 (iso 159)
  515.  
  516.     Character sets covering the required characters only
  517.  
  518.     NATS-DANO (iso 9)
  519.     NS_4551-1 (iso 60)
  520.     NS_4551-2 (iso 61)
  521.     ISO_8859-4:1988 (iso 110)
  522.  
  523.  
  524.     3.8.  da Danish
  525.  
  526.     Required characters
  527.  
  528.     ae    00e6 LATIN SMALL LETTER AE
  529.     aa    00e5 LATIN SMALL LETTER A WITH RING ABOVE
  530.     o/    00f8 LATIN SMALL LETTER O WITH STROKE
  531.  
  532.     Optional characters
  533.  
  534.  
  535.  
  536.  
  537.  
  538. Alvestrand                Expires Dec 17 93                  [Page 10]
  539.  
  540. draft                Languages and character sets               Mar 93
  541.  
  542.  
  543.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  544.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  545.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  546.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  547.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  548.     y'    00fd LATIN SMALL LETTER Y WITH ACUTE
  549.  
  550.     Character sets covering the whole
  551.  
  552.     videotex-suppl (iso 70)
  553.     iso-ir-90 (iso 90)
  554.     ANSI_X3.110-1983 (iso 99)
  555.     ISO_8859-1:1987 (iso 100)
  556.     T.61-8bit (iso 103)
  557.     T.101-G2 (iso 128)
  558.     ISO_6937-2-add (iso 142)
  559.     latin6 (iso 157)
  560.     JIS_X0212-1990 (iso 159)
  561.  
  562.     Character sets covering the required characters only
  563.  
  564.     NATS-DANO (iso 9)
  565.     NS_4551-1 (iso 60)
  566.     NS_4551-2 (iso 61)
  567.     ISO_8859-4:1988 (iso 110)
  568.     ISO_8859-9:1989 (iso 148)
  569.  
  570.  
  571.     3.9.  fo Faeroese
  572.  
  573.     Required characters
  574.  
  575.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  576.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  577.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  578.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  579.     y'    00fd LATIN SMALL LETTER Y WITH ACUTE
  580.     ae    00e6 LATIN SMALL LETTER AE
  581.     o/    00f8 LATIN SMALL LETTER O WITH STROKE
  582.     d-    00f0 LATIN SMALL LETTER ETH (Icelandic)
  583.  
  584.     Character sets covering the whole
  585.  
  586.     videotex-suppl (iso 70)
  587.  
  588.  
  589.  
  590.  
  591.  
  592. Alvestrand                Expires Dec 17 93                  [Page 11]
  593.  
  594. draft                Languages and character sets               Mar 93
  595.  
  596.  
  597.     iso-ir-90 (iso 90)
  598.     ANSI_X3.110-1983 (iso 99)
  599.     ISO_8859-1:1987 (iso 100)
  600.     T.61-8bit (iso 103)
  601.     T.101-G2 (iso 128)
  602.     ISO_6937-2-add (iso 142)
  603.     latin6 (iso 157)
  604.     JIS_X0212-1990 (iso 159)
  605.  
  606.  
  607.     3.10.  is Icelandic
  608.  
  609.     Required characters
  610.  
  611.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  612.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  613.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  614.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  615.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  616.     y'    00fd LATIN SMALL LETTER Y WITH ACUTE
  617.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  618.     ae    00e6 LATIN SMALL LETTER AE
  619.     d-    00f0 LATIN SMALL LETTER ETH (Icelandic)
  620.     th    00fe LATIN SMALL LETTER THORN (Icelandic)
  621.  
  622.     Character sets covering the whole
  623.  
  624.     videotex-suppl (iso 70)
  625.     iso-ir-90 (iso 90)
  626.     ANSI_X3.110-1983 (iso 99)
  627.     ISO_8859-1:1987 (iso 100)
  628.     T.61-8bit (iso 103)
  629.     T.101-G2 (iso 128)
  630.     ISO_6937-2-add (iso 142)
  631.     latin6 (iso 157)
  632.     JIS_X0212-1990 (iso 159)
  633.  
  634.  
  635.     3.11.  kl Greenlandic
  636.  
  637.     Required characters
  638.  
  639.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  640.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  641.  
  642.  
  643.  
  644.  
  645.  
  646. Alvestrand                Expires Dec 17 93                  [Page 12]
  647.  
  648. draft                Languages and character sets               Mar 93
  649.  
  650.  
  651.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  652.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  653.     a>    00e2 LATIN SMALL LETTER A WITH CIRCUMFLEX
  654.     e>    00ea LATIN SMALL LETTER E WITH CIRCUMFLEX
  655.     i>    00ee LATIN SMALL LETTER I WITH CIRCUMFLEX
  656.     o>    00f4 LATIN SMALL LETTER O WITH CIRCUMFLEX
  657.     u>    00fb LATIN SMALL LETTER U WITH CIRCUMFLEX
  658.     ae    00e6 LATIN SMALL LETTER AE
  659.     aa    00e5 LATIN SMALL LETTER A WITH RING ABOVE
  660.     o/    00f8 LATIN SMALL LETTER O WITH STROKE
  661.     a?    00e3 LATIN SMALL LETTER A WITH TILDE
  662.     i?    0129 LATIN SMALL LETTER I WITH TILDE
  663.     u?    0169 LATIN SMALL LETTER U WITH TILDE
  664.     kk    0138 LATIN SMALL LETTER KRA (Greenlandic)
  665.  
  666.     Character sets covering the whole
  667.  
  668.     videotex-suppl (iso 70)
  669.     iso-ir-90 (iso 90)
  670.     ANSI_X3.110-1983 (iso 99)
  671.     T.61-8bit (iso 103)
  672.     T.101-G2 (iso 128)
  673.     ISO_6937-2-add (iso 142)
  674.  
  675.  
  676.     3.12.  ?? Gaelic
  677.  
  678.     Required characters
  679.  
  680.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  681.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  682.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  683.     a!    00e0 LATIN SMALL LETTER A WITH GRAVE
  684.     e!    00e8 LATIN SMALL LETTER E WITH GRAVE
  685.     i!    00ec LATIN SMALL LETTER I WITH GRAVE
  686.     o!    00f2 LATIN SMALL LETTER O WITH GRAVE
  687.     u!    00f9 LATIN SMALL LETTER U WITH GRAVE
  688.  
  689.     Character sets covering the whole
  690.  
  691.     GB_2312-80 (iso 58)
  692.     videotex-suppl (iso 70)
  693.     iso-ir-90 (iso 90)
  694.     ANSI_X3.110-1983 (iso 99)
  695.  
  696.  
  697.  
  698.  
  699.  
  700. Alvestrand                Expires Dec 17 93                  [Page 13]
  701.  
  702. draft                Languages and character sets               Mar 93
  703.  
  704.  
  705.     ISO_8859-1:1987 (iso 100)
  706.     T.61-8bit (iso 103)
  707.     ISO_8859-3:1988 (iso 109)
  708.     T.101-G2 (iso 128)
  709.     ISO_6937-2-add (iso 142)
  710.     JIS_X0212-1990 (iso 159)
  711.  
  712.  
  713.     3.13.  ga Irish
  714.  
  715.     Required characters
  716.  
  717.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  718.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  719.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  720.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  721.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  722.  
  723.     Character sets covering the whole
  724.  
  725.     GB_2312-80 (iso 58)
  726.     videotex-suppl (iso 70)
  727.     iso-ir-90 (iso 90)
  728.     ANSI_X3.110-1983 (iso 99)
  729.     ISO_8859-1:1987 (iso 100)
  730.     ISO_8859-2:1987 (iso 101)
  731.     T.61-8bit (iso 103)
  732.     ISO_8859-3:1988 (iso 109)
  733.     CSA_Z243.4-1985-gr (iso 123)
  734.     T.101-G2 (iso 128)
  735.     CSN_369103 (iso 139)
  736.     ISO_6937-2-add (iso 142)
  737.     ISO_8859-9:1989 (iso 148)
  738.     latin6 (iso 157)
  739.     JIS_X0212-1990 (iso 159)
  740.  
  741.  
  742.     3.14.  cy Welsh
  743.  
  744.     Required characters
  745.  
  746.     w'    1e83 LATIN SMALL LETTER W WITH ACUTE
  747.     y'    00fd LATIN SMALL LETTER Y WITH ACUTE
  748.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  749.  
  750.  
  751.  
  752.  
  753.  
  754. Alvestrand                Expires Dec 17 93                  [Page 14]
  755.  
  756. draft                Languages and character sets               Mar 93
  757.  
  758.  
  759.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  760.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  761.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  762.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  763.     a!    00e0 LATIN SMALL LETTER A WITH GRAVE
  764.     e!    00e8 LATIN SMALL LETTER E WITH GRAVE
  765.     i!    00ec LATIN SMALL LETTER I WITH GRAVE
  766.     o!    00f2 LATIN SMALL LETTER O WITH GRAVE
  767.     u!    00f9 LATIN SMALL LETTER U WITH GRAVE
  768.     w!    1e81 LATIN SMALL LETTER W WITH GRAVE
  769.     y!    1ef3 LATIN SMALL LETTER Y WITH GRAVE
  770.     a>    00e2 LATIN SMALL LETTER A WITH CIRCUMFLEX
  771.     e>    00ea LATIN SMALL LETTER E WITH CIRCUMFLEX
  772.     i>    00ee LATIN SMALL LETTER I WITH CIRCUMFLEX
  773.     o>    00f4 LATIN SMALL LETTER O WITH CIRCUMFLEX
  774.     u>    00fb LATIN SMALL LETTER U WITH CIRCUMFLEX
  775.     w>    0175 LATIN SMALL LETTER W WITH CIRCUMFLEX
  776.     y>    0177 LATIN SMALL LETTER Y WITH CIRCUMFLEX
  777.     a:    00e4 LATIN SMALL LETTER A WITH DIAERESIS
  778.     e:    00eb LATIN SMALL LETTER E WITH DIAERESIS
  779.     i:    00ef LATIN SMALL LETTER I WITH DIAERESIS
  780.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  781.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  782.     w:    1e85 LATIN SMALL LETTER W WITH DIAERESIS
  783.     y:    00ff LATIN SMALL LETTER Y WITH DIAERESIS
  784.     This language has no known character set
  785.  
  786.  
  787.     3.15.  br Breton
  788.  
  789.     Required characters
  790.  
  791.     e>    00ea LATIN SMALL LETTER E WITH CIRCUMFLEX
  792.     u!    00f9 LATIN SMALL LETTER U WITH GRAVE
  793.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  794.     n?    00f1 LATIN SMALL LETTER N WITH TILDE
  795.  
  796.     Character sets covering the whole
  797.  
  798.     videotex-suppl (iso 70)
  799.     iso-ir-90 (iso 90)
  800.     ANSI_X3.110-1983 (iso 99)
  801.     ISO_8859-1:1987 (iso 100)
  802.     T.61-8bit (iso 103)
  803.  
  804.  
  805.  
  806.  
  807.  
  808. Alvestrand                Expires Dec 17 93                  [Page 15]
  809.  
  810. draft                Languages and character sets               Mar 93
  811.  
  812.  
  813.     ISO_8859-3:1988 (iso 109)
  814.     CSA_Z243.4-1985-gr (iso 123)
  815.     T.101-G2 (iso 128)
  816.     ISO_6937-2-add (iso 142)
  817.     JIS_X0212-1990 (iso 159)
  818.  
  819.  
  820.     3.16.  fy Frisian
  821.  
  822.     Required characters
  823.  
  824.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  825.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  826.     a>    00e2 LATIN SMALL LETTER A WITH CIRCUMFLEX
  827.     e>    00ea LATIN SMALL LETTER E WITH CIRCUMFLEX
  828.     o>    00f4 LATIN SMALL LETTER O WITH CIRCUMFLEX
  829.     u>    00fb LATIN SMALL LETTER U WITH CIRCUMFLEX
  830.     a:    00e4 LATIN SMALL LETTER A WITH DIAERESIS
  831.     e:    00eb LATIN SMALL LETTER E WITH DIAERESIS
  832.     i:    00ef LATIN SMALL LETTER I WITH DIAERESIS
  833.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  834.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  835.  
  836.     Character sets covering the whole
  837.  
  838.     videotex-suppl (iso 70)
  839.     iso-ir-90 (iso 90)
  840.     ANSI_X3.110-1983 (iso 99)
  841.     ISO_8859-1:1987 (iso 100)
  842.     T.61-8bit (iso 103)
  843.     ISO_8859-3:1988 (iso 109)
  844.     T.101-G2 (iso 128)
  845.     ISO_6937-2-add (iso 142)
  846.  
  847.  
  848.     3.17.  nl Dutch
  849.  
  850.     Required characters
  851.  
  852.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  853.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  854.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  855.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  856.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  857.  
  858.  
  859.  
  860.  
  861.  
  862. Alvestrand                Expires Dec 17 93                  [Page 16]
  863.  
  864. draft                Languages and character sets               Mar 93
  865.  
  866.  
  867.     a:    00e4 LATIN SMALL LETTER A WITH DIAERESIS
  868.     e:    00eb LATIN SMALL LETTER E WITH DIAERESIS
  869.     i:    00ef LATIN SMALL LETTER I WITH DIAERESIS
  870.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  871.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  872.     ij    0133 LATIN SMALL LIGATURE IJ
  873.  
  874.     Character sets covering the whole
  875.  
  876.     videotex-suppl (iso 70)
  877.     iso-ir-90 (iso 90)
  878.     ANSI_X3.110-1983 (iso 99)
  879.     T.61-8bit (iso 103)
  880.     T.101-G2 (iso 128)
  881.     ISO_6937-2-add (iso 142)
  882.     JIS_X0212-1990 (iso 159)
  883.  
  884.  
  885.     3.18.  af Afrikaans
  886.  
  887.     Required characters
  888.  
  889.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  890.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  891.     e!    00e8 LATIN SMALL LETTER E WITH GRAVE
  892.     a>    00e2 LATIN SMALL LETTER A WITH CIRCUMFLEX
  893.     e>    00ea LATIN SMALL LETTER E WITH CIRCUMFLEX
  894.     i>    00ee LATIN SMALL LETTER I WITH CIRCUMFLEX
  895.     o>    00f4 LATIN SMALL LETTER O WITH CIRCUMFLEX
  896.     u>    00fb LATIN SMALL LETTER U WITH CIRCUMFLEX
  897.     e:    00eb LATIN SMALL LETTER E WITH DIAERESIS
  898.     i:    00ef LATIN SMALL LETTER I WITH DIAERESIS
  899.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  900.  
  901.     Character sets covering the whole
  902.  
  903.     videotex-suppl (iso 70)
  904.     iso-ir-90 (iso 90)
  905.     ANSI_X3.110-1983 (iso 99)
  906.     T.61-8bit (iso 103)
  907.     T.101-G2 (iso 128)
  908.     ISO_6937-2-add (iso 142)
  909.  
  910.  
  911.  
  912.  
  913.  
  914.  
  915.  
  916. Alvestrand                Expires Dec 17 93                  [Page 17]
  917.  
  918. draft                Languages and character sets               Mar 93
  919.  
  920.  
  921.     3.19.  de German
  922.  
  923.     Required characters
  924.  
  925.     a:    00e4 LATIN SMALL LETTER A WITH DIAERESIS
  926.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  927.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  928.     ss    00df LATIN SMALL LETTER SHARP S (German)
  929.  
  930.     Optional characters
  931.  
  932.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  933.     a!    00e0 LATIN SMALL LETTER A WITH GRAVE
  934.  
  935.     Comments
  936.  
  937.     The "ss" character exists only in lower case; the upper case
  938.     equivalent is "SS" (2 letters).
  939.  
  940.     Character sets covering the whole
  941.  
  942.     videotex-suppl (iso 70)
  943.     iso-ir-90 (iso 90)
  944.     ANSI_X3.110-1983 (iso 99)
  945.     ISO_8859-1:1987 (iso 100)
  946.     T.61-8bit (iso 103)
  947.     ISO_8859-3:1988 (iso 109)
  948.     T.101-G2 (iso 128)
  949.     ISO_6937-2-add (iso 142)
  950.     ISO_8859-9:1989 (iso 148)
  951.     JIS_X0212-1990 (iso 159)
  952.  
  953.     Character sets covering the required characters only
  954.  
  955.     DIN_66003 (iso 21)
  956.     ISO_8859-2:1987 (iso 101)
  957.     ISO_8859-4:1988 (iso 110)
  958.     CSN_369103 (iso 139)
  959.     latin6 (iso 157)
  960.  
  961.  
  962.  
  963.  
  964.  
  965.  
  966.  
  967.  
  968.  
  969.  
  970. Alvestrand                Expires Dec 17 93                  [Page 18]
  971.  
  972. draft                Languages and character sets               Mar 93
  973.  
  974.  
  975.     3.20.  fr French
  976.  
  977.     Required characters
  978.  
  979.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  980.     e!    00e8 LATIN SMALL LETTER E WITH GRAVE
  981.     u!    00f9 LATIN SMALL LETTER U WITH GRAVE
  982.     c,    00e7 LATIN SMALL LETTER C WITH CEDILLA
  983.     a!    00e0 LATIN SMALL LETTER A WITH GRAVE
  984.  
  985.     Optional characters
  986.  
  987.     a>    00e2 LATIN SMALL LETTER A WITH CIRCUMFLEX
  988.     e>    00ea LATIN SMALL LETTER E WITH CIRCUMFLEX
  989.     i>    00ee LATIN SMALL LETTER I WITH CIRCUMFLEX
  990.     o>    00f4 LATIN SMALL LETTER O WITH CIRCUMFLEX
  991.     u>    00fb LATIN SMALL LETTER U WITH CIRCUMFLEX
  992.     ae    00e6 LATIN SMALL LETTER AE
  993.     oe    0153 LATIN SMALL LIGATURE OE
  994.     e:    00eb LATIN SMALL LETTER E WITH DIAERESIS
  995.     i:    00ef LATIN SMALL LETTER I WITH DIAERESIS
  996.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  997.     y:    00ff LATIN SMALL LETTER Y WITH DIAERESIS
  998.  
  999.     Character sets covering the whole
  1000.  
  1001.     videotex-suppl (iso 70)
  1002.     iso-ir-90 (iso 90)
  1003.     ANSI_X3.110-1983 (iso 99)
  1004.     T.61-8bit (iso 103)
  1005.     T.101-G2 (iso 128)
  1006.     ISO_6937-2-add (iso 142)
  1007.  
  1008.     Character sets covering the required characters only
  1009.  
  1010.     IT (iso 15)
  1011.     NF_Z_62-010_(1973) (iso 25)
  1012.     NF_Z_62-010 (iso 69)
  1013.     ISO_8859-1:1987 (iso 100)
  1014.     ISO_8859-3:1988 (iso 109)
  1015.     CSA_Z243.4-1985-1 (iso 121)
  1016.     CSA_Z243.4-1985-2 (iso 122)
  1017.     CSA_Z243.4-1985-gr (iso 123)
  1018.     ISO_8859-9:1989 (iso 148)
  1019.  
  1020.  
  1021.  
  1022.  
  1023.  
  1024. Alvestrand                Expires Dec 17 93                  [Page 19]
  1025.  
  1026. draft                Languages and character sets               Mar 93
  1027.  
  1028.  
  1029.     JIS_X0212-1990 (iso 159)
  1030.  
  1031.  
  1032.     3.21.  ca Catalan
  1033.  
  1034.     Required characters
  1035.  
  1036.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  1037.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  1038.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  1039.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  1040.     a!    00e0 LATIN SMALL LETTER A WITH GRAVE
  1041.     e!    00e8 LATIN SMALL LETTER E WITH GRAVE
  1042.     o!    00f2 LATIN SMALL LETTER O WITH GRAVE
  1043.     i:    00ef LATIN SMALL LETTER I WITH DIAERESIS
  1044.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  1045.     l.    0140 LATIN SMALL LETTER L WITH MIDDLE DOT
  1046.     n?    00f1 LATIN SMALL LETTER N WITH TILDE
  1047.  
  1048.     Character sets covering the whole
  1049.  
  1050.     videotex-suppl (iso 70)
  1051.     iso-ir-90 (iso 90)
  1052.     ANSI_X3.110-1983 (iso 99)
  1053.     T.61-8bit (iso 103)
  1054.     T.101-G2 (iso 128)
  1055.     ISO_6937-2-add (iso 142)
  1056.     JIS_X0212-1990 (iso 159)
  1057.  
  1058.  
  1059.     3.22.  es Spanish
  1060.  
  1061.     Required characters
  1062.  
  1063.     n?    00f1 LATIN SMALL LETTER N WITH TILDE
  1064.     c,    00e7 LATIN SMALL LETTER C WITH CEDILLA
  1065.     !I    00a1 INVERTED EXCLAMATION MARK
  1066.     ?I    00bf INVERTED QUESTION MARK
  1067.  
  1068.     Optional characters
  1069.  
  1070.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  1071.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  1072.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  1073.  
  1074.  
  1075.  
  1076.  
  1077.  
  1078. Alvestrand                Expires Dec 17 93                  [Page 20]
  1079.  
  1080. draft                Languages and character sets               Mar 93
  1081.  
  1082.  
  1083.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  1084.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  1085.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  1086.     n?    00f1 LATIN SMALL LETTER N WITH TILDE
  1087.  
  1088.     Comments
  1089.  
  1090.     Note that this language also uses special punctuation marks.  The
  1091.     c, appears in ISO 646-ES, but not in van Wingen's tables.
  1092.  
  1093.     Character sets covering the whole
  1094.  
  1095.     videotex-suppl (iso 70)
  1096.     iso-ir-90 (iso 90)
  1097.     ANSI_X3.110-1983 (iso 99)
  1098.     ISO_8859-1:1987 (iso 100)
  1099.     T.61-8bit (iso 103)
  1100.     CSA_Z243.4-1985-gr (iso 123)
  1101.     T.101-G2 (iso 128)
  1102.     ISO_6937-2-add (iso 142)
  1103.     ISO_8859-9:1989 (iso 148)
  1104.     JIS_X0212-1990 (iso 159)
  1105.  
  1106.     Character sets covering the required characters only
  1107.  
  1108.     ES (iso 17)
  1109.     ES2 (iso 85)
  1110.  
  1111.  
  1112.     3.23.  gl Galician
  1113.  
  1114.     Required characters
  1115.  
  1116.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  1117.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  1118.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  1119.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  1120.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  1121.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  1122.     n?    00f1 LATIN SMALL LETTER N WITH TILDE
  1123.  
  1124.     Character sets covering the whole
  1125.  
  1126.     videotex-suppl (iso 70)
  1127.  
  1128.  
  1129.  
  1130.  
  1131.  
  1132. Alvestrand                Expires Dec 17 93                  [Page 21]
  1133.  
  1134. draft                Languages and character sets               Mar 93
  1135.  
  1136.  
  1137.     iso-ir-90 (iso 90)
  1138.     ANSI_X3.110-1983 (iso 99)
  1139.     ISO_8859-1:1987 (iso 100)
  1140.     T.61-8bit (iso 103)
  1141.     ISO_8859-3:1988 (iso 109)
  1142.     CSA_Z243.4-1985-gr (iso 123)
  1143.     T.101-G2 (iso 128)
  1144.     ISO_6937-2-add (iso 142)
  1145.     ISO_8859-9:1989 (iso 148)
  1146.     JIS_X0212-1990 (iso 159)
  1147.  
  1148.  
  1149.     3.24.  pt Portuguese
  1150.  
  1151.     Required characters
  1152.  
  1153.     a?    00e3 LATIN SMALL LETTER A WITH TILDE
  1154.     o?    00f5 LATIN SMALL LETTER O WITH TILDE
  1155.     c,    00e7 LATIN SMALL LETTER C WITH CEDILLA
  1156.  
  1157.     Optional characters
  1158.  
  1159.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  1160.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  1161.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  1162.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  1163.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  1164.     a!    00e0 LATIN SMALL LETTER A WITH GRAVE
  1165.     a>    00e2 LATIN SMALL LETTER A WITH CIRCUMFLEX
  1166.     e>    00ea LATIN SMALL LETTER E WITH CIRCUMFLEX
  1167.     o>    00f4 LATIN SMALL LETTER O WITH CIRCUMFLEX
  1168.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  1169.  
  1170.     Character sets covering the whole
  1171.  
  1172.     videotex-suppl (iso 70)
  1173.     iso-ir-90 (iso 90)
  1174.     ANSI_X3.110-1983 (iso 99)
  1175.     ISO_8859-1:1987 (iso 100)
  1176.     T.61-8bit (iso 103)
  1177.     T.101-G2 (iso 128)
  1178.     ISO_6937-2-add (iso 142)
  1179.     JIS_X0212-1990 (iso 159)
  1180.  
  1181.  
  1182.  
  1183.  
  1184.  
  1185.  
  1186. Alvestrand                Expires Dec 17 93                  [Page 22]
  1187.  
  1188. draft                Languages and character sets               Mar 93
  1189.  
  1190.  
  1191.     Character sets covering the required characters only
  1192.  
  1193.     PT (iso 16)
  1194.     PT2 (iso 84)
  1195.     ISO_8859-9:1989 (iso 148)
  1196.  
  1197.  
  1198.     3.25.  eu Basque
  1199.  
  1200.     Required characters
  1201.  
  1202.     n?    00f1 LATIN SMALL LETTER N WITH TILDE
  1203.     c,    00e7 LATIN SMALL LETTER C WITH CEDILLA
  1204.  
  1205.     Character sets covering the whole
  1206.  
  1207.     ES (iso 17)
  1208.     videotex-suppl (iso 70)
  1209.     ES2 (iso 85)
  1210.     iso-ir-90 (iso 90)
  1211.     ANSI_X3.110-1983 (iso 99)
  1212.     ISO_8859-1:1987 (iso 100)
  1213.     T.61-8bit (iso 103)
  1214.     ISO_8859-3:1988 (iso 109)
  1215.     CSA_Z243.4-1985-gr (iso 123)
  1216.     T.101-G2 (iso 128)
  1217.     ISO_6937-2-add (iso 142)
  1218.     ISO_8859-9:1989 (iso 148)
  1219.     JIS_X0212-1990 (iso 159)
  1220.  
  1221.  
  1222.     3.26.  mt Maltese
  1223.  
  1224.     Required characters
  1225.  
  1226.     a!    00e0 LATIN SMALL LETTER A WITH GRAVE
  1227.     e!    00e8 LATIN SMALL LETTER E WITH GRAVE
  1228.     i!    00ec LATIN SMALL LETTER I WITH GRAVE
  1229.     o!    00f2 LATIN SMALL LETTER O WITH GRAVE
  1230.     u!    00f9 LATIN SMALL LETTER U WITH GRAVE
  1231.     i>    00ee LATIN SMALL LETTER I WITH CIRCUMFLEX
  1232.     c.    010b LATIN SMALL LETTER C WITH DOT ABOVE
  1233.     g.    0121 LATIN SMALL LETTER G WITH DOT ABOVE
  1234.     h/    0127 LATIN SMALL LETTER H WITH STROKE
  1235.  
  1236.  
  1237.  
  1238.  
  1239.  
  1240. Alvestrand                Expires Dec 17 93                  [Page 23]
  1241.  
  1242. draft                Languages and character sets               Mar 93
  1243.  
  1244.  
  1245.     z.    017c LATIN SMALL LETTER Z WITH DOT ABOVE
  1246.  
  1247.     Character sets covering the whole
  1248.  
  1249.     videotex-suppl (iso 70)
  1250.     iso-ir-90 (iso 90)
  1251.     ANSI_X3.110-1983 (iso 99)
  1252.     T.61-8bit (iso 103)
  1253.     ISO_8859-3:1988 (iso 109)
  1254.     T.101-G2 (iso 128)
  1255.     ISO_6937-2-add (iso 142)
  1256.     JIS_X0212-1990 (iso 159)
  1257.  
  1258.  
  1259.     3.27.  it Italian
  1260.  
  1261.     Required characters
  1262.  
  1263.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  1264.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  1265.     a!    00e0 LATIN SMALL LETTER A WITH GRAVE
  1266.     e!    00e8 LATIN SMALL LETTER E WITH GRAVE
  1267.     i!    00ec LATIN SMALL LETTER I WITH GRAVE
  1268.     o!    00f2 LATIN SMALL LETTER O WITH GRAVE
  1269.  
  1270.     Optional characters
  1271.  
  1272.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  1273.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  1274.     u!    00f9 LATIN SMALL LETTER U WITH GRAVE
  1275.     i:    00ef LATIN SMALL LETTER I WITH DIAERESIS
  1276.  
  1277.     Comments
  1278.  
  1279.     The accented characters appear only in the lower case variant in
  1280.     the Italian version of ISO 646 (ISO-IR-15).
  1281.  
  1282.     Character sets covering the whole
  1283.  
  1284.     videotex-suppl (iso 70)
  1285.     iso-ir-90 (iso 90)
  1286.     ANSI_X3.110-1983 (iso 99)
  1287.     ISO_8859-1:1987 (iso 100)
  1288.     T.61-8bit (iso 103)
  1289.  
  1290.  
  1291.  
  1292.  
  1293.  
  1294. Alvestrand                Expires Dec 17 93                  [Page 24]
  1295.  
  1296. draft                Languages and character sets               Mar 93
  1297.  
  1298.  
  1299.     ISO_8859-3:1988 (iso 109)
  1300.     T.101-G2 (iso 128)
  1301.     ISO_6937-2-add (iso 142)
  1302.     JIS_X0212-1990 (iso 159)
  1303.  
  1304.     Character sets covering the required characters only
  1305.  
  1306.     GB_2312-80 (iso 58)
  1307.  
  1308.  
  1309.     3.28.  ?? Rhaetian
  1310.  
  1311.     Required characters
  1312.  
  1313.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  1314.     a!    00e0 LATIN SMALL LETTER A WITH GRAVE
  1315.     e!    00e8 LATIN SMALL LETTER E WITH GRAVE
  1316.     o!    00f2 LATIN SMALL LETTER O WITH GRAVE
  1317.     a>    00e2 LATIN SMALL LETTER A WITH CIRCUMFLEX
  1318.     e>    00ea LATIN SMALL LETTER E WITH CIRCUMFLEX
  1319.     i>    00ee LATIN SMALL LETTER I WITH CIRCUMFLEX
  1320.     o>    00f4 LATIN SMALL LETTER O WITH CIRCUMFLEX
  1321.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  1322.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  1323.  
  1324.     Character sets covering the whole
  1325.  
  1326.     videotex-suppl (iso 70)
  1327.     iso-ir-90 (iso 90)
  1328.     ANSI_X3.110-1983 (iso 99)
  1329.     ISO_8859-1:1987 (iso 100)
  1330.     T.61-8bit (iso 103)
  1331.     ISO_8859-3:1988 (iso 109)
  1332.     T.101-G2 (iso 128)
  1333.     ISO_6937-2-add (iso 142)
  1334.     JIS_X0212-1990 (iso 159)
  1335.  
  1336.  
  1337.     3.29.  ro Romanian
  1338.  
  1339.     Required characters
  1340.  
  1341.     a>    00e2 LATIN SMALL LETTER A WITH CIRCUMFLEX
  1342.     i>    00ee LATIN SMALL LETTER I WITH CIRCUMFLEX
  1343.  
  1344.  
  1345.  
  1346.  
  1347.  
  1348. Alvestrand                Expires Dec 17 93                  [Page 25]
  1349.  
  1350. draft                Languages and character sets               Mar 93
  1351.  
  1352.  
  1353.     a(    0103 LATIN SMALL LETTER A WITH BREVE
  1354.     s,    015f LATIN SMALL LETTER S WITH CEDILLA
  1355.     t,    0163 LATIN SMALL LETTER T WITH CEDILLA
  1356.  
  1357.     Character sets covering the whole
  1358.  
  1359.     videotex-suppl (iso 70)
  1360.     iso-ir-90 (iso 90)
  1361.     ANSI_X3.110-1983 (iso 99)
  1362.     ISO_8859-2:1987 (iso 101)
  1363.     T.61-8bit (iso 103)
  1364.     T.101-G2 (iso 128)
  1365.     CSN_369103 (iso 139)
  1366.     ISO_6937-2-add (iso 142)
  1367.     JIS_X0212-1990 (iso 159)
  1368.  
  1369.  
  1370.     3.30.  hu Hungarian
  1371.  
  1372.     Required characters
  1373.  
  1374.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  1375.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  1376.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  1377.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  1378.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  1379.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  1380.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  1381.     o"    0151 LATIN SMALL LETTER O WITH DOUBLE ACUTE
  1382.     u"    0171 LATIN SMALL LETTER U WITH DOUBLE ACUTE
  1383.  
  1384.     Character sets covering the whole
  1385.  
  1386.     videotex-suppl (iso 70)
  1387.     iso-ir-90 (iso 90)
  1388.     ANSI_X3.110-1983 (iso 99)
  1389.     ISO_8859-2:1987 (iso 101)
  1390.     T.61-8bit (iso 103)
  1391.     T.101-G2 (iso 128)
  1392.     CSN_369103 (iso 139)
  1393.     ISO_6937-2-add (iso 142)
  1394.     JIS_X0212-1990 (iso 159)
  1395.  
  1396.  
  1397.  
  1398.  
  1399.  
  1400.  
  1401.  
  1402. Alvestrand                Expires Dec 17 93                  [Page 26]
  1403.  
  1404. draft                Languages and character sets               Mar 93
  1405.  
  1406.  
  1407.     3.31.  sq Albanian
  1408.  
  1409.     Required characters
  1410.  
  1411.     e:    00eb LATIN SMALL LETTER E WITH DIAERESIS
  1412.     c,    00e7 LATIN SMALL LETTER C WITH CEDILLA
  1413.  
  1414.     Character sets covering the whole
  1415.  
  1416.     videotex-suppl (iso 70)
  1417.     iso-ir-90 (iso 90)
  1418.     ANSI_X3.110-1983 (iso 99)
  1419.     ISO_8859-1:1987 (iso 100)
  1420.     ISO_8859-2:1987 (iso 101)
  1421.     T.61-8bit (iso 103)
  1422.     ISO_8859-3:1988 (iso 109)
  1423.     CSA_Z243.4-1985-gr (iso 123)
  1424.     T.101-G2 (iso 128)
  1425.     CSN_369103 (iso 139)
  1426.     ISO_6937-2-add (iso 142)
  1427.     ISO_8859-9:1989 (iso 148)
  1428.     JIS_X0212-1990 (iso 159)
  1429.  
  1430.  
  1431.     3.32.  tr Turkish
  1432.  
  1433.     Required characters
  1434.  
  1435.     a>    00e2 LATIN SMALL LETTER A WITH CIRCUMFLEX
  1436.     i>    00ee LATIN SMALL LETTER I WITH CIRCUMFLEX
  1437.     u>    00fb LATIN SMALL LETTER U WITH CIRCUMFLEX
  1438.     o:    00f6 LATIN SMALL LETTER O WITH DIAERESIS
  1439.     u:    00fc LATIN SMALL LETTER U WITH DIAERESIS
  1440.     i.    0131 LATIN SMALL LETTER I WITH NO DOT
  1441.     c,    00e7 LATIN SMALL LETTER C WITH CEDILLA
  1442.     s,    015f LATIN SMALL LETTER S WITH CEDILLA
  1443.     g(    011f LATIN SMALL LETTER G WITH BREVE
  1444.  
  1445.     Character sets covering the whole
  1446.  
  1447.     videotex-suppl (iso 70)
  1448.     iso-ir-90 (iso 90)
  1449.     ANSI_X3.110-1983 (iso 99)
  1450.     T.61-8bit (iso 103)
  1451.  
  1452.  
  1453.  
  1454.  
  1455.  
  1456. Alvestrand                Expires Dec 17 93                  [Page 27]
  1457.  
  1458. draft                Languages and character sets               Mar 93
  1459.  
  1460.  
  1461.     ISO_8859-3:1988 (iso 109)
  1462.     T.101-G2 (iso 128)
  1463.     ISO_6937-2-add (iso 142)
  1464.     ISO_8859-9:1989 (iso 148)
  1465.  
  1466.  
  1467.     3.33.  hr Croatian
  1468.  
  1469.     Required characters
  1470.  
  1471.     c'    0107 LATIN SMALL LETTER C WITH ACUTE
  1472.     d/    0111 LATIN SMALL LETTER D WITH STROKE
  1473.     c<    010d LATIN SMALL LETTER C WITH CARON
  1474.     s<    0161 LATIN SMALL LETTER S WITH CARON
  1475.     z<    017e LATIN SMALL LETTER Z WITH CARON
  1476.  
  1477.     Character sets covering the whole
  1478.  
  1479.     videotex-suppl (iso 70)
  1480.     iso-ir-90 (iso 90)
  1481.     ANSI_X3.110-1983 (iso 99)
  1482.     ISO_8859-2:1987 (iso 101)
  1483.     T.61-8bit (iso 103)
  1484.     T.101-G2 (iso 128)
  1485.     CSN_369103 (iso 139)
  1486.     JUS_I.B1.002 (iso 141)
  1487.     ISO_6937-2-add (iso 142)
  1488.     JIS_X0212-1990 (iso 159)
  1489.  
  1490.  
  1491.     3.34.  sl Slovenian
  1492.  
  1493.     Required characters
  1494.  
  1495.     c<    010d LATIN SMALL LETTER C WITH CARON
  1496.     s<    0161 LATIN SMALL LETTER S WITH CARON
  1497.     z<    017e LATIN SMALL LETTER Z WITH CARON
  1498.  
  1499.     Character sets covering the whole
  1500.  
  1501.     videotex-suppl (iso 70)
  1502.     iso-ir-90 (iso 90)
  1503.     ANSI_X3.110-1983 (iso 99)
  1504.     ISO_8859-2:1987 (iso 101)
  1505.  
  1506.  
  1507.  
  1508.  
  1509.  
  1510. Alvestrand                Expires Dec 17 93                  [Page 28]
  1511.  
  1512. draft                Languages and character sets               Mar 93
  1513.  
  1514.  
  1515.     T.61-8bit (iso 103)
  1516.     ISO_8859-4:1988 (iso 110)
  1517.     T.101-G2 (iso 128)
  1518.     CSN_369103 (iso 139)
  1519.     JUS_I.B1.002 (iso 141)
  1520.     ISO_6937-2-add (iso 142)
  1521.     latin6 (iso 157)
  1522.     JIS_X0212-1990 (iso 159)
  1523.  
  1524.  
  1525.     3.35.  sk Slovak
  1526.  
  1527.     Required characters
  1528.  
  1529.     y'    00fd LATIN SMALL LETTER Y WITH ACUTE
  1530.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  1531.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  1532.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  1533.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  1534.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  1535.     a:    00e4 LATIN SMALL LETTER A WITH DIAERESIS
  1536.     o>    00f4 LATIN SMALL LETTER O WITH CIRCUMFLEX
  1537.     l'    013a LATIN SMALL LETTER L WITH ACUTE
  1538.     r'    0155 LATIN SMALL LETTER R WITH ACUTE
  1539.     c<    010d LATIN SMALL LETTER C WITH CARON
  1540.     d<    010f LATIN SMALL LETTER D WITH CARON
  1541.     l<    013e LATIN SMALL LETTER L WITH CARON
  1542.     n<    0148 LATIN SMALL LETTER N WITH CARON
  1543.     s<    0161 LATIN SMALL LETTER S WITH CARON
  1544.     t<    0165 LATIN SMALL LETTER T WITH CARON
  1545.     z<    017e LATIN SMALL LETTER Z WITH CARON
  1546.  
  1547.     Character sets covering the whole
  1548.  
  1549.     videotex-suppl (iso 70)
  1550.     iso-ir-90 (iso 90)
  1551.     ANSI_X3.110-1983 (iso 99)
  1552.     ISO_8859-2:1987 (iso 101)
  1553.     T.61-8bit (iso 103)
  1554.     T.101-G2 (iso 128)
  1555.     CSN_369103 (iso 139)
  1556.     ISO_6937-2-add (iso 142)
  1557.  
  1558.  
  1559.  
  1560.  
  1561.  
  1562.  
  1563.  
  1564. Alvestrand                Expires Dec 17 93                  [Page 29]
  1565.  
  1566. draft                Languages and character sets               Mar 93
  1567.  
  1568.  
  1569.     3.36.  cs Czech
  1570.  
  1571.     Required characters
  1572.  
  1573.     y'    00fd LATIN SMALL LETTER Y WITH ACUTE
  1574.     a'    00e1 LATIN SMALL LETTER A WITH ACUTE
  1575.     e'    00e9 LATIN SMALL LETTER E WITH ACUTE
  1576.     i'    00ed LATIN SMALL LETTER I WITH ACUTE
  1577.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  1578.     u'    00fa LATIN SMALL LETTER U WITH ACUTE
  1579.     e<    011b LATIN SMALL LETTER E WITH CARON
  1580.     u0    016f LATIN SMALL LETTER U WITH RING ABOVE
  1581.     c<    010d LATIN SMALL LETTER C WITH CARON
  1582.     d<    010f LATIN SMALL LETTER D WITH CARON
  1583.     n<    0148 LATIN SMALL LETTER N WITH CARON
  1584.     r<    0159 LATIN SMALL LETTER R WITH CARON
  1585.     s<    0161 LATIN SMALL LETTER S WITH CARON
  1586.     t<    0165 LATIN SMALL LETTER T WITH CARON
  1587.     z<    017e LATIN SMALL LETTER Z WITH CARON
  1588.  
  1589.     Character sets covering the whole
  1590.  
  1591.     videotex-suppl (iso 70)
  1592.     iso-ir-90 (iso 90)
  1593.     ANSI_X3.110-1983 (iso 99)
  1594.     ISO_8859-2:1987 (iso 101)
  1595.     T.61-8bit (iso 103)
  1596.     T.101-G2 (iso 128)
  1597.     CSN_369103 (iso 139)
  1598.     ISO_6937-2-add (iso 142)
  1599.  
  1600.  
  1601.     3.37.  pl Polish
  1602.  
  1603.     Required characters
  1604.  
  1605.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  1606.     a;    0105 LATIN SMALL LETTER A WITH OGONEK
  1607.     e;    0119 LATIN SMALL LETTER E WITH OGONEK
  1608.     c'    0107 LATIN SMALL LETTER C WITH ACUTE
  1609.     n'    0144 LATIN SMALL LETTER N WITH ACUTE
  1610.     s'    015b LATIN SMALL LETTER S WITH ACUTE
  1611.     z'    017a LATIN SMALL LETTER Z WITH ACUTE
  1612.     l/    0142 LATIN SMALL LETTER L WITH STROKE
  1613.  
  1614.  
  1615.  
  1616.  
  1617.  
  1618. Alvestrand                Expires Dec 17 93                  [Page 30]
  1619.  
  1620. draft                Languages and character sets               Mar 93
  1621.  
  1622.  
  1623.     z.    017c LATIN SMALL LETTER Z WITH DOT ABOVE
  1624.  
  1625.     Character sets covering the whole
  1626.  
  1627.     videotex-suppl (iso 70)
  1628.     iso-ir-90 (iso 90)
  1629.     ANSI_X3.110-1983 (iso 99)
  1630.     ISO_8859-2:1987 (iso 101)
  1631.     T.61-8bit (iso 103)
  1632.     T.101-G2 (iso 128)
  1633.     CSN_369103 (iso 139)
  1634.     ISO_6937-2-add (iso 142)
  1635.     JIS_X0212-1990 (iso 159)
  1636.  
  1637.  
  1638.     3.38.  ?? Sorbian
  1639.  
  1640.     Required characters
  1641.  
  1642.     o'    00f3 LATIN SMALL LETTER O WITH ACUTE
  1643.     e<    011b LATIN SMALL LETTER E WITH CARON
  1644.     c'    0107 LATIN SMALL LETTER C WITH ACUTE
  1645.     n'    0144 LATIN SMALL LETTER N WITH ACUTE
  1646.     s'    015b LATIN SMALL LETTER S WITH ACUTE
  1647.     z'    017a LATIN SMALL LETTER Z WITH ACUTE
  1648.     l/    0142 LATIN SMALL LETTER L WITH STROKE
  1649.     c<    010d LATIN SMALL LETTER C WITH CARON
  1650.     r<    0159 LATIN SMALL LETTER R WITH CARON
  1651.     s<    0161 LATIN SMALL LETTER S WITH CARON
  1652.     z<    017e LATIN SMALL LETTER Z WITH CARON
  1653.  
  1654.     Character sets covering the whole
  1655.  
  1656.     videotex-suppl (iso 70)
  1657.     iso-ir-90 (iso 90)
  1658.     ANSI_X3.110-1983 (iso 99)
  1659.     ISO_8859-2:1987 (iso 101)
  1660.     T.61-8bit (iso 103)
  1661.     T.101-G2 (iso 128)
  1662.     CSN_369103 (iso 139)
  1663.     ISO_6937-2-add (iso 142)
  1664.  
  1665.  
  1666.  
  1667.  
  1668.  
  1669.  
  1670.  
  1671.  
  1672. Alvestrand                Expires Dec 17 93                  [Page 31]
  1673.  
  1674. draft                Languages and character sets               Mar 93
  1675.  
  1676.  
  1677.     3.39.  eo Esperanto
  1678.  
  1679.     Required characters
  1680.  
  1681.     u(    016d LATIN SMALL LETTER U WITH BREVE
  1682.     c>    0109 LATIN SMALL LETTER C WITH CIRCUMFLEX
  1683.     g>    011d LATIN SMALL LETTER G WITH CIRCUMFLEX
  1684.     h>    0125 LATIN SMALL LETTER H WITH CIRCUMFLEX
  1685.     j>    0135 LATIN SMALL LETTER J WITH CIRCUMFLEX
  1686.     s>    015d LATIN SMALL LETTER S WITH CIRCUMFLEX
  1687.  
  1688.     Character sets covering the whole
  1689.  
  1690.     videotex-suppl (iso 70)
  1691.     iso-ir-90 (iso 90)
  1692.     ANSI_X3.110-1983 (iso 99)
  1693.     T.61-8bit (iso 103)
  1694.     ISO_8859-3:1988 (iso 109)
  1695.     T.101-G2 (iso 128)
  1696.     ISO_6937-2-add (iso 142)
  1697.     ISO_8859-supp (iso 154)
  1698.     JIS_X0212-1990 (iso 159)
  1699.  
  1700.  
  1701.     4.  Other languages with appropriate character sets
  1702.     Other languages for which appropriate character sets are known are
  1703.     listed in the table below.
  1704.  
  1705.     Language        Character set
  1706.  
  1707.     ar Arabic       ISO-8859-6
  1708.     be Byelorussian ISO-8859-5
  1709.     bg Bulgarian    ISO-8859-5
  1710.     el Greek        ISO-8859-7
  1711.     en English      USASCII
  1712.     fa Persian      ISO-8859-6
  1713.     iw Hebrew       ISO-8859-8
  1714.     ja Japanese     ISO-IR-87 (Japanese JIS C6226-1983)
  1715.     ko Korean       ISO-IR-149 (Korean KS C 5601-1989)
  1716.     la Latin        USASCII
  1717.     lo Laotian      ISO-IR-166
  1718.     ru Russian      ISO-8859-5
  1719.     sw Swahili      USASCII
  1720.     th Thai         ISO-IR-166
  1721.  
  1722.  
  1723.  
  1724.  
  1725.  
  1726. Alvestrand                Expires Dec 17 93                  [Page 32]
  1727.  
  1728. draft                Languages and character sets               Mar 93
  1729.  
  1730.  
  1731.     uk Ukrainian    ISO-8859-5
  1732.     ur Urdu         ISO-8859-6
  1733.     vo Volapuk      ISO-8859-1
  1734.     zh Chinese      ISO-IR-58 (Chinese GB 2312-80)
  1735.  
  1736.     Additional entries in this table are welcome!
  1737.  
  1738.  
  1739.     4.1.  ISO 10646 only languages
  1740.  
  1741.     The following languages can (to the author's limited knowledge) be
  1742.     written with the current ISO 10646 standard, but with no other
  1743.     registered character sets:
  1744.  
  1745.  
  1746.     Language               Country(ies)             Script(s)
  1747.  
  1748.     aa Afar                 Somalia, Ethiopia, Djibouti     Latin
  1749.     ab Abkhazian            Georgia                         Cyrillic
  1750.     am Amharic              Ethiopia                        Ethiopic
  1751.     as Assamese             India, Nepal                    Bengali
  1752.     ay Aymara               Bolivia, Peru, Chile            Latin
  1753.     az Azerbaijani          SNC, Iran, Iraq, Turkey         Cyrillic, Arabic
  1754.     ba Bashkir              SNC                             Cyrillic
  1755.     bh Bihari               India                           Gujarati (or Kaithi)
  1756.     bi Bislama              Vanuatu, New Caledonia          Latin
  1757.     bn Bengali              India                           Bengali
  1758.     co Corsican             France                          Latin
  1759.     fj Fiji                 Fiji                            Latin
  1760.     gd Scots                UK                              Latin
  1761.     gn Guarani              Paraguay                        Latin
  1762.     gu Gujarati             India                           Gujarati
  1763.     ha Hausa                Nigeria, Niger, Chad, Sudan,... Latin
  1764.     hi Hindi                India                           Devanagari
  1765.     hy Armenian             Armenia                         Armenian
  1766.     ia Interlingua          None (Artificial Language)      Latin
  1767.     ie Interlingue          None (Artificial Language)      Latin
  1768.     ik Inupiak              USA, Cannada                    Latin, Cree
  1769.     in Indonesian           Indonesia                       Latin
  1770.     ji Yiddish              Germany, USA, SNC, Israel       Hebrew
  1771.     jw Javanese             Indonesia, Malaysia             Latin, Javanese
  1772.     ka Georgian             Georgia                         Georgian
  1773.     kk Kazakh               SNC, Afghanistan                Cyrillic, Arabic
  1774.     km Cambodian            Cambodia                        Khmer
  1775.  
  1776.  
  1777.  
  1778.  
  1779.  
  1780. Alvestrand                Expires Dec 17 93                  [Page 33]
  1781.  
  1782. draft                Languages and character sets               Mar 93
  1783.  
  1784.  
  1785.     kn Kannada              India                           Kannada
  1786.     ks Kashmiri             India, Pakistan                 Arabic
  1787.     ku Kurdish              SNC, Turkey, Iraq, Iran         Cyrillic, Arabic
  1788.     ky Kirghiz              SNC, China, Afghanistan         Cyrillic, Arabic
  1789.     ln Lingala              CAR, Congo, Zaire               Latin
  1790.     mg Malagasy             Madagascar, Comoro Islands      Latin, Arabic
  1791.     mi Maori                New Zealand                     Latin
  1792.     mk Macedonian           Greece, Yugoslavia              Greek, Cyrillic
  1793.     ml Malayalam            India                           Malayalam
  1794.     mn Mongolian            Mongolia                        Cyrillic, Mongolian
  1795.     mo Moldavian            Romania                         Latin
  1796.     mr Marathi              India                           Devanagari
  1797.     ms Malay                Malaysia, Thailand              Latin
  1798.     my Burmese              Myanmar                         Burmese
  1799.     na Nauru                Nauru                           Latin
  1800.     ne Nepali               Nepal                           Devanagari
  1801.     oc Occitan              France                          Latin
  1802.     or Oriya                India                           Oriya
  1803.     pa Punjabi              India                           Gurmukhi
  1804.     ps Pashto (Western)     Afghanistan, Iran               Arabic
  1805.     qu Quechua              Peru                            Latin
  1806.     rm Rhaeto               Swizerland                      Latin
  1807.     rn Kirundi              Burundi, Uganda                 Latin
  1808.     rw Kinyarwanda          Rwanda, Uganda, Zaire           Latin
  1809.     sa Sanskrit             India                           Devanagari
  1810.     sd Sindhi               Pakistan, India, Afghanistan    Arabic, Gurmukhi
  1811.     sg Sangro               Central African Republic        Latin
  1812.     si Singhalese           Sri Lanka                       Sinhalese
  1813.     sm Samoan               Samoa, USA, New Zealand         Latin
  1814.     sn Shona                Zimbabwe, Zambia, Mozambique    Latin
  1815.     so Somali               Somalia, Ethiopia, Djibouti     Latin
  1816.     sr Serbian              former Yugoslavia               Cyrillic
  1817.     ss Siswati              S. Africa, Swaziland            Latin
  1818.     st Sesotho              S. Africa, Lesotho              Latin
  1819.     su Sudanese             Sudan                           Latin
  1820.     ta Tamil                India, Malaysia                 Tamil
  1821.     te Tegulu               India                           Telugu
  1822.     tg Tajik                Tajikistan                      Arabic
  1823.     ti Tigrinya             Ethiopia                        Latin, Ethiopic
  1824.     tk Turkmen              SNC, Iran, Afghanistan          Cyrillic, Arabic
  1825.     tl Tagalog              Phillipines                     Latin
  1826.     tn Setswana             S. Africa, Botswana, Namibia    Latin
  1827.     to Tonga (3)            Mozambique                      Latin
  1828.     ts Tsonga               Mozambique, Swaziland           Latin
  1829.  
  1830.  
  1831.  
  1832.  
  1833.  
  1834. Alvestrand                Expires Dec 17 93                  [Page 34]
  1835.  
  1836. draft                Languages and character sets               Mar 93
  1837.  
  1838.  
  1839.     tt Tatar                SNC                             Cyrillic
  1840.     tw Twi (Ewe)            Ghana                           Latin
  1841.     uz Uzbek (Southern)     Afghanistan, Turkey             Arabic
  1842.     vi Vietnamese           Vietnam, Cambodia, China        Latin
  1843.     wo Wolof                Senegal, Mauritania             Latin
  1844.     xh Xhosa                S. Africa                       Latin
  1845.     yo Yoruba               Nigeria, Togo, Benin            Latin
  1846.     zu Zulu                 S. Africa, Lesotho, Malawi      Latin
  1847.  
  1848.  
  1849.     The information about languages in ISO 10646 was kindly supplied
  1850.     by Glenn Adams <glenn@metis.com>
  1851.  
  1852.     Languages for which the author does NOT know any proper character
  1853.     set include:
  1854.  
  1855.  
  1856.     bo Tibetan
  1857.     dz Bhutani
  1858.     et Estonian
  1859.     lt Lithuanian
  1860.     lv Latvian, Lettish
  1861.     mt Maltese
  1862.     sh Serbo-Croatian
  1863.  
  1864.  
  1865.  
  1866.     5.  Encoded format of charset data
  1867.  
  1868.     This section contains, in a very compact format, all the
  1869.     information used to make the technical content of this RFC, apart
  1870.     from the content of ISO 639 and RFC 1345.
  1871.  
  1872.     It would be helpful if new information was also supplied in this
  1873.     format.
  1874.  
  1875.  
  1876.     # A list of languages and their required/optional characters.
  1877.     # Format:
  1878.     # &language Name
  1879.     # Required characters
  1880.     # Important characters
  1881.     # Comments
  1882.      &language Lithuanian
  1883.  
  1884.  
  1885.  
  1886.  
  1887.  
  1888. Alvestrand                Expires Dec 17 93                  [Page 35]
  1889.  
  1890. draft                Languages and character sets               Mar 93
  1891.  
  1892.  
  1893.      a; e; i; u; e. u- c< s< z<
  1894.  
  1895.      &language Latvian
  1896.      a- e- i- o- u- g, k, l, n, r, c< s< z<
  1897.  
  1898.      &language Estonian
  1899.      o? a: o: u: s< z<
  1900.  
  1901.      &language Finnish
  1902.      a: o:
  1903.  
  1904.      &language Sami
  1905.      a' e' a> a: e: i: o: u: ae aa o/ d/ n' ng t/ c< s< z<
  1906.  
  1907.      &language Swedish
  1908.      a: o: aa
  1909.      a' e' e: u:
  1910.  
  1911.      &language Norwegian
  1912.      ae aa o/
  1913.      e' o' o>
  1914.  
  1915.      &language Danish
  1916.      ae aa o/
  1917.      a' e' i' o' u' y'
  1918.  
  1919.      &language Faeroese
  1920.      a' i' o' u' y' ae o/ d-
  1921.  
  1922.      &language Icelandic
  1923.      a' e' i' o' u' y' o: ae d- th
  1924.  
  1925.      &language Greenlandic
  1926.      a' e' i' u' a> e> i> o> u> ae aa o/ a? i? u? kk
  1927.  
  1928.      &language Gaelic
  1929.      a' e' o' a! e! i! o! u!
  1930.  
  1931.      &language Irish
  1932.      a' e' i' o' u'
  1933.  
  1934.      &language Welsh
  1935.      w' y' a' e' i' o' u' a! e! i! o! u! w! y! a> e> i> o> u> w> y> a: e: i: o: u: w: y:
  1936.  
  1937.  
  1938.  
  1939.  
  1940.  
  1941.  
  1942. Alvestrand                Expires Dec 17 93                  [Page 36]
  1943.  
  1944. draft                Languages and character sets               Mar 93
  1945.  
  1946.  
  1947.      &language Breton
  1948.      e> u! u: n?
  1949.  
  1950.      &language Frisian
  1951.      e' u' a> e> o> u> a: e: i: o: u:
  1952.  
  1953.      &language Dutch
  1954.      a' e' i' o' u' a: e: i: o: u: ij
  1955.  
  1956.      &language Afrikaans
  1957.      a' e' e! a> e> i> o> u> e: i: o: 'n
  1958.  
  1959.      &language German
  1960.      a: o: u: ss
  1961.      e' a!
  1962.     The "ss" character exists only in lower case; the upper case equivalent
  1963.     is "SS" (2 letters).
  1964.  
  1965.      &language French
  1966.      e' e! u! c, a!
  1967.      a> e> i> o> u> ae oe e: i: u: y:
  1968.  
  1969.      &language Catalan
  1970.      e' i' o' u' a! e! o! i: u: l. n?
  1971.  
  1972.      &language Spanish
  1973.      n?  c, !I ?I
  1974.      a' e' i' o' u' u: n?
  1975.     Note that this language also uses special punctuation marks.
  1976.     The c, appears in ISO 646-ES, but not in van Wingen's tables.
  1977.  
  1978.  
  1979.      &language Galician
  1980.      a' e' i' o' u' u: n?
  1981.  
  1982.      &language Portuguese
  1983.      a? o? c,
  1984.      a' e' i' o' u' a! a> e> o> u:
  1985.  
  1986.      &language Basque
  1987.      n? c,
  1988.  
  1989.      &language Maltese
  1990.      a! e! i! o! u! i> c. g. h/ z.
  1991.  
  1992.  
  1993.  
  1994.  
  1995.  
  1996. Alvestrand                Expires Dec 17 93                  [Page 37]
  1997.  
  1998. draft                Languages and character sets               Mar 93
  1999.  
  2000.  
  2001.      &language Italian
  2002.      e' o' a! e! i! o!
  2003.      i' u' u! i:
  2004.     The accented characters appear only in the lower case variant in
  2005.     the Italian version of ISO 646 (ISO-IR-15).
  2006.  
  2007.      &language Rhaetian
  2008.      e' a! e! o! a> e> i> o> o: u:
  2009.  
  2010.      &language Romanian
  2011.      a> i> a( s, t,
  2012.  
  2013.      &language Hungarian
  2014.      a' e' i' o' u' o: u: o" u"
  2015.  
  2016.      &language Albanian
  2017.      e: c,
  2018.  
  2019.      &language Turkish
  2020.      a> i> u> o: u: i. c, s, g(
  2021.  
  2022.      &language Croatian
  2023.      c' d/ c< s< z<
  2024.  
  2025.      &language Slovenian
  2026.      c< s< z<
  2027.  
  2028.      &language Slovak
  2029.      y' a' e' i' o' u' a: o> l' r' c< d< l< n< s< t< z<
  2030.  
  2031.      &language Czech
  2032.      y' a' e' i' o' u' e< u0 c< d< n< r< s< t< z<
  2033.  
  2034.      &language Polish
  2035.      o' a; e; c' n' s' z' l/ z.
  2036.  
  2037.      &language Sorbian
  2038.      o' e< c' n' s' z' l/ c< r< s< z<
  2039.  
  2040.      &language Esperanto
  2041.      u( c> g> h> j> s>
  2042.  
  2043.  
  2044.  
  2045.  
  2046.  
  2047.  
  2048.  
  2049.  
  2050. Alvestrand                Expires Dec 17 93                  [Page 38]
  2051.  
  2052. draft                Languages and character sets               Mar 93
  2053.  
  2054.  
  2055.     6.  REFERENCES
  2056.  
  2057.  
  2058.     [ISO 8859]
  2059.          Information technology - 8-bit single-byte coded graphic
  2060.          character sets
  2061.  
  2062.     [ISO 6937]
  2063.          Information processing - Coded graphic character set for text
  2064.          communication
  2065.  
  2066.     [ISO 639]
  2067.          Codes for identifying languages (1988 version)
  2068.  
  2069.     [ISO 10646]
  2070.          Information technology - Universal Multiple-Octet Coded
  2071.          Character Set
  2072.  
  2073.     [RFC-KELD]
  2074.          Keld Simonsen: Character Mnemonics & Character Sets, RFC
  2075.          1345, June 1992
  2076.  
  2077.  
  2078.  
  2079.  
  2080.  
  2081.  
  2082.  
  2083.  
  2084.  
  2085.  
  2086.  
  2087.  
  2088.  
  2089.  
  2090.  
  2091.  
  2092.  
  2093.  
  2094.  
  2095.  
  2096.  
  2097.  
  2098.  
  2099.  
  2100.  
  2101.  
  2102.  
  2103.  
  2104. Alvestrand                Expires Dec 17 93                  [Page 39]
  2105.  
  2106. draft                Languages and character sets               Mar 93
  2107.  
  2108.  
  2109.     Table of Contents
  2110.  
  2111.  
  2112.      Abstract ...................................................    1
  2113.      Status of this Memo ........................................    1
  2114.     1 Introduction ..............................................    2
  2115.     2 Introduction to language tables ...........................    2
  2116.     2.1 Table structure .........................................    3
  2117.     2.2 Sources utilized ........................................    4
  2118.     2.3 What accents mean .......................................    4
  2119.     3 Language tables ...........................................    5
  2120.     3.1 lt Lithuanian ...........................................    5
  2121.     3.2 lv Latvian ..............................................    6
  2122.     3.3 et Estonian .............................................    7
  2123.     3.4 fi Finnish ..............................................    7
  2124.     3.5 ?? Sami .................................................    8
  2125.     3.6 sv Swedish ..............................................    9
  2126.     3.7 no Norwegian ............................................   10
  2127.     3.8 da Danish ...............................................   10
  2128.     3.9 fo Faeroese .............................................   11
  2129.     3.10 is Icelandic ...........................................   12
  2130.     3.11 kl Greenlandic .........................................   12
  2131.     3.12 ?? Gaelic ..............................................   13
  2132.     3.13 ga Irish ...............................................   14
  2133.     3.14 cy Welsh ...............................................   14
  2134.     3.15 br Breton ..............................................   15
  2135.     3.16 fy Frisian .............................................   16
  2136.     3.17 nl Dutch ...............................................   16
  2137.     3.18 af Afrikaans ...........................................   17
  2138.     3.19 de German ..............................................   18
  2139.     3.20 fr French ..............................................   19
  2140.     3.21 ca Catalan .............................................   20
  2141.     3.22 es Spanish .............................................   20
  2142.     3.23 gl Galician ............................................   21
  2143.     3.24 pt Portuguese ..........................................   22
  2144.     3.25 eu Basque ..............................................   23
  2145.     3.26 mt Maltese .............................................   23
  2146.     3.27 it Italian .............................................   24
  2147.     3.28 ?? Rhaetian ............................................   25
  2148.     3.29 ro Romanian ............................................   25
  2149.     3.30 hu Hungarian ...........................................   26
  2150.     3.31 sq Albanian ............................................   27
  2151.     3.32 tr Turkish .............................................   27
  2152.     3.33 hr Croatian ............................................   28
  2153.  
  2154.  
  2155.  
  2156.  
  2157.  
  2158. Alvestrand                Expires Dec 17 93                  [Page 40]
  2159.  
  2160. draft                Languages and character sets               Mar 93
  2161.  
  2162.  
  2163.     3.34 sl Slovenian ...........................................   28
  2164.     3.35 sk Slovak ..............................................   29
  2165.     3.36 cs Czech ...............................................   30
  2166.     3.37 pl Polish ..............................................   30
  2167.     3.38 ?? Sorbian .............................................   31
  2168.     3.39 eo Esperanto ...........................................   32
  2169.     4 Other languages with appropriate character sets ...........   32
  2170.     4.1 ISO 10646 only languages ................................   33
  2171.     5 Encoded format of charset data ............................   35
  2172.     6 REFERENCES ................................................   39
  2173.  
  2174.  
  2175.  
  2176.  
  2177.  
  2178.  
  2179.  
  2180.  
  2181.  
  2182.  
  2183.  
  2184.  
  2185.  
  2186.  
  2187.  
  2188.  
  2189.  
  2190.  
  2191.  
  2192.  
  2193.  
  2194.  
  2195.  
  2196.  
  2197.  
  2198.  
  2199.  
  2200.  
  2201.  
  2202.  
  2203.  
  2204.  
  2205.  
  2206.  
  2207.  
  2208.  
  2209.  
  2210.  
  2211.  
  2212. Alvestrand                Expires Dec 17 93                  [Page 41]
  2213.  
  2214.  
  2215.